- Che cos’è Steam?
- Perché vale la pena analizzare questi dati?
- Che tipi di relazioni possiamo osservare?
- Cosa possiamo valutare?
- Possiamo usare questi dati per consigliare videogiochi da giocare?
8/8/2020
DT, visNetwork, networkD3 Rcpp, sets, rmarkdown circlize, knitr, plyr dplyr, ggplot2, igraph purrr, ggraph, tidyr tidygraph, rlang, netrankr corrplot, lpSolve, lpSolveAPI Rglpk, DT
I dataset considerati sono in totale tre:
Tutti ottenuti dalla piattaforma Kaggle.
L’analisi è incentrata sui primi due.
Mostriamo qui la struttura del primo dataset:
Con una prima e rapida analisi possiamo calcolare le dimensioni effettive del dataset:
Si vede già qui il problema del “backlog”.
Molto più ricco è invece il secondo dataset:
Con un totale di 27075 giochi.
Quali sono i giochi più giocati?
Nelle prime posizioni sono quasi tutti giochi di Valve.
In scala logaritmica:
Da Kaggle non era possibile avere delle informazioni precise su quando il dataset 200K fosse stato acquisito. E’ possibile datarlo utilizzando tre dati:
L’assenza di giocatori di Civilization VI risulta statisticamente improbabile:
Basato sulla percentuale di valutazioni positive degli utenti Steam:
Star Wars Battlefront II è un gioco emblematico per questo fenomeno.
Volendo usare sempre i dati di metacritic si perderebbero 1321 giochi e 817 giocatori. Per questo:
Essere un gioco Indie ha un impatto positivo o negativo?
Cosa vuol dire veramente “Free to Play”?
Questo è solo un esempio di uso possibile per le Tag.
In scala logaritmica:
Segue il modello ad attacco preferenziale di Barabasi-Albert
La ricerca delle componenti connesse restituisce il seguente output, mostrando la presenza della componente gigante, come atteso.
[1] 16 [[1]] [1] "Dimensione: 3 Numero: 14" [[2]] [1] "Dimensione: 4 Numero: 1" [[3]] [1] "Dimensione: 13036 Numero: 1"
Gli archi mostrano la quantità di utenti che giocano a entrambi i giochi (nodi) adiacenti.
Fast greedy: (modularità 0.160)
Louvain: (modularità 0.182)
Walktrap: (modularità 0.147)
La modularità basata su uguaglianza di tag è bassa ed è 0.02252084
Secondo il metodo Louvain:
Unione di più aspetti:
Esempio d’uso
Molti altri aspetti da valutare:
Risultati: